教授/研究

国内资深教授 - 中国知识创新

教授/研究

国内资深教授 - 中国知识创新

如何让AI招聘更靠谱？| 数智前沿

据领英（LinkedIn）等招聘网站的调研估计，全球约有35%~45%的企业已经在员工招聘的流程中采用自动化或AI工具。AI工具进行招聘活动具有哪些优点和局限性？如何减少AI工具应用的偏差，降低人们在招聘中对其的不信任感？在新作《数智时代的人力资源管理》一书中，中欧国际工商学院管理学教授韩践对这些问题展开了探讨和解答。

当前，业务主管对于人力资源管理职能最常见的批评就是“招聘和甄选的产出跟不上业务的需求”。这个批评覆盖了“数量”和“质量”两个问题。其中招聘质量比数量问题更具挑战性，因为涉及到“匹配”。

自从科学管理时代以来，人-岗匹配和人-组织的匹配问题一直是企业管理面临的核心挑战之一。导致这个问题的原因有很多：比如，很多企业在招聘时采用一些相对粗糙的人才标准，甚至不使用事先规划的人才标准，“看着顺眼”就进；或者在甄选时过于强调可量化的“硬”技能，而忽视了岗位实际需要的“软”素质。负责招聘的管理者为了节约时间和成本，倾向于使用直觉主导的、信度和效度较低的方法（比如非结构化面试）。

此外，很多公司内部的招聘政策、导向和流程都出现不一致，随意性很强。这些问题都会影响招聘和甄选的效果，降低人员选拔对企业应有的价值。

随着数智技术的发展，我们都期待新技术能够帮助我们提升人才匹配的效率，即用人工智能技术将招聘和甄选过程中重复耗时的工作自动化，并在整个招聘过程中实现个性化的数据分析和推荐功能，使招聘人员可以专注于复杂的甄选判断和沟通工作。

据LinkedIn等招聘网站的调研估计，全球约有35%-45%的企业已经在员工招聘的流程中采用自动化或人工智能工具。下图是数智技术在招聘活动中的常见应用。

01

数智技术在招聘活动中有哪些优势？

数智技术在提升招聘和选拔效率方面有很多优势，比如它可以快速处理大量简历，通过自动化的初步筛选，大大降低初筛阶段的人力和时间成本。现在市场上的一些工具通过自然语言处理（NLP）分析简历和社交媒体数据，评估视频面试的表现，甚至利用算法判断个人与职位的匹配度。

此外，越来越多的算法还能结合各种心理测量量表，比如认知能力和责任心等，根据不同的岗位需求进行加权处理来预测员工的绩效表现。在面试环节，数智应用可以记录和分析候选人的声音（例如音调、音量和节奏）、身体动作（例如手势、姿势等）以及面部表情（如快乐、惊讶、愤怒等），从而综合评估候选人的个人特点、表达风格、沟通技巧、说服力、抗压性，以及逻辑能力，并结合其它测评数据预测申请者的工作表现。

随着算法分析的预测因子增多，以及数据量的增加，算法能更加深入地理解这些因子和工作表现之间的关系，减少预测误差，帮助管理者们更有效地进行人才选拔。

很多企业的招聘所面临的主要问题是缺乏结构化的人员招聘和选拔流程，在这些企业，面试官和决策者的主观喜好起到了比较重要的作用，很可能导致有偏见的决策，从而降低整个招聘体系的内部一致性和甄选效能。在这种场景下，使用数智化工具促进人员选拔流程的标准化和结构化，可以增加申请者们对于申请流程的公平感。

数智技术还有一个重要优势，就是其个性化和适配能力。通过分析简历和招聘需求，算法能够根据市场变化和企业需求，给管理者提供适配建议。相较于传统的信息处理方式，当前数智技术的发展趋势是处理多种数据形式，比如文本、音频和视频，为拉通和整合大量无结构、嘈杂的数据提供了新的可能性。

随着数据管理能力的提升，算法甚至可能打破公司传统的人才选拔框架，发现一些以前未被重视但非常有价值的标准。

近年的一些研究揭示了算法可能会在甄选时带来惊喜：即从数据中挖掘出“非传统”人才：这些人可能来自非“精英”的学院，不一定满足企业常用的一些“硬杠杠”，比如相关工作经验、专业资质或大学成绩，但因其在某些方面表现出的强项（例如责任心强或表达能力出众）而被算法选中。算法这些不走寻常路的“思考”方式可以启发我们拓展人才招聘的思路，提升人岗匹配的效果。目前对于人工智能甄选的有效性已经积累了一定的实证结果。例如，在视频甄选方面的研究表明，经过专家评估的模型通过分析申请者的面部表情、语言和声调信息（如音高），能够较好地预测申请者的性格特质。其中，口头表述的内容文本（即申请者“说了什么”）对预测效果的贡献最大；而面部和声音节律信息对预测效果的贡献则相对较少。进一步看，在训练人工智能评估人格特质，例如“责任心”和“外向性格”时，使用面试官的评价数据比使用申请者自我报告的评估数据效果更好。

此外，人工智能在分析社交媒体数据（如申请者如何在社交媒体中展示自己）方面初现成果。例如，通过分析Facebook（美国社交媒体平台，现称Meta）上的文本内容，人工智能模型可以预测申请者的人格特质和智力水平等，且其预测结果在六个月的时间间隔内保持相对稳定。研究显示，相比于自我报告的人格测试，人工智能基于社交媒体数据预测的人格特质比人类招聘者的预测准确度略有提高。

还有一些研究表明，由算法选拔的候选人通过面试并入职的可能性比一般选拔流程高出14%，这些员工入职后的生产力会高出0.2-0.4个标准差，且在薪资谈判中提出异议的可能性也要低12%。此外，大部分研究都提到使用算法可以大幅节省选拔成本。

02

数智化应用在招聘和甄选领域有哪些局限性？

消除算法的偏见在很大程度上取决于用来训练模型的数据：如果训练模型的数据承接了过往招聘和甄选模式的偏见，那么即便算法和模型是可靠的，偏见可能依然会在数智化招聘中存在，甚至在系统标准化执行的过程中被放大。

在2014年，亚马逊工程师团队启动了一个旨在自动化招聘流程的项目，包括一个用于筛选简历的算法。然而，公司发现该算法对申请软件工程师职位的女性申请者存在系统性歧视。训练算法的数据主要基于男性工程师的简历，导致算法倾向于选择与现有男性员工简历相似的申请者。具体歧视方式包括对毕业于女子学院的候选人不利，降低包含“女性”词汇的简历评分，以及偏好使用男性倾向动词的简历等。尽管程序员尝试修复这一问题，但最终未能成功，亚马逊在一年后停止使用该软件。

这个事件引起了人们对算法偏见的广泛关注，并警醒人们，当数智技术进一步提升企业招聘和甄选效率的同时，企业需要持续识别和刷新那些真正能够促进企业成功和员工高绩效的驱动因素，并以此为基础训练模型，减少由于数据偏差或人类偏见带来的甄选“噪音”。

在招聘和甄选时使用的人才标准一般是基于岗位描述以及企业内部绩优员工的“特征”来构建的。但是，对于这种做法一直有质疑的声音。

首先，输出绩效分数和绩优员工特征的绩效管理体系，是不是很靠得住呢？当被问及“哪些特征能够解释和区分员工之间的绩效差异”时，恐怕很多企业对其绩效评估和管理体系都不是十分自信：大多数企业的绩效考核体系严重地偏向财务指标和显性的量化结果，这些从数字到数字的体系很容易忽略工作过程和员工日常行为。而现实中的绩优员工，是有血有肉的，其特质和绩效之间的关系复杂而“立体”，需要大量过程数据和行为数据来诠释和提炼他们的特点才能形成有效的模型。

如果我们甄选的时候，只关注一些显而易见的表面特征（例如毕业院校、性别、工作经验），而忽略了影响实际工作绩效的深层要素（如合作精神、学习潜力等），根据这样的模式构建的算法也会错过一些真正有潜力的候选人。这就是为什么在依赖算法做出重要决策之前，我们必须仔细考量和验证我们用来构建算法的数据质量以及假设的完整性与合理性。

03

如何让AI更“靠谱”？

首先，我们要分析选拔体系的整体效率和效益。

自上世纪90年代以来，企业采纳了多种方法量化和分析招聘的效能。针对招聘体系的分析主要包括成本效益分析、时间效率分析、招聘质量分析（如新员工的早期绩效、离职率和员工满意度）、招聘渠道效果、应聘者体验、招聘转化率以及招聘投资回报率（ROI）等。这些方法能够帮助组织更精准地评估员工招聘的成本、速度、质量以及招聘活动对组织的长期影响。

此外，通过对不同招聘渠道的分析，组织可以找到更有效的招聘途径；通过调查新员工的应聘体验、入职后绩效和满意度，可以帮助我们提升招聘活动的质量和公司的雇主品牌。当我们在这些方面的运营数据积累到一定程度时，还可以建立模型来全面提升招聘和甄选的投入和产出。

值得注意的是，使用数智化工具并不是提升甄选效果的灵丹妙药。当前企业的招聘和选拔体系常常被诟病“无效”，关键问题是投入不足，急功近利。很多企业倾向于选择低成本且方便的招聘方法，例如仅仅采用面试就做出决策，省去了笔试、特质评估和工作样本等多种测试结合的方法。这样做虽然降低了局部的成本，但可能导致因人员配置不当影响整个组织的效率和效益。

工业心理学的大量研究表明，管理成熟度更高的企业通常会采用多种甄选方式的组合以提升人才选拔的效果，而精心规划和实施招聘活动还将为企业和员工奠定良好的雇佣关系。因此，我们经常说，管理员工体验的起始点是招聘工作开始的那一刻，而不是进入公司签约的时候。

面对AI的发展，企业都有一个“提效梦”。需要提醒企业的是，实施算法招聘需要在数据获取、清洗、软硬件以及培训方面进行大量的前期投资；包括对算法进行反复培训，提升其模型的有效性和准确度。前期的投入会耗费大量资源，企业对此要有合理的预算和预期。